# 处理excle数据
# 下载pandas，openpyxl
# 导入第三方库pandas， 导库用关键词import,用到as关键字
import pandas as pd


# 读取excel标数据， 获取的是Dateframe对象,读取excel内容， 需要函数read_excel内容，需要函数read_excel()
df = pd.read_excel(r'C:\Users\Administrator\Desktop\111.xlsx')
print(df)


 # 写文件到excle
a1 = {'姓名': 'zhangesan', '年龄': 22}
a2 = {'姓名': 'lisi', '年龄': 21}
a3 = {'姓名': 'wanqwu', '年龄': 20}
l1 = [a1, a2, a3]
print(l1)
# 需要将列表变成DataFrame格式
# df1 = pd.DataFrame格式
df1 = pd.DataFrame(l1)
print(df1)
# 存数据使用pandas的函数to_excle(), index:索引
df1.to_excel('222.xlsx', index=False)




# 处理word文档，需要下载python-docx
# 导入docx库中的Document模块
from docx import  Document
# 打开docx文档,获取文档对象
doc = Document('2023年国务院政府工作报告.docx')
print(doc)
# 获取word段落，使用paragraphs， 得到的是列表,len()计算列表元素个数
p = doc.paragraphs
print(p)
print(len(p))
# 遍历列表， 显示断落内容，使用text
for i in p:
    print(i.text)

